
刚刚,北大校友Lilian Weng自曝公司首个产品?一篇论文未发,估值却已90亿
刚刚,北大校友Lilian Weng自曝公司首个产品?一篇论文未发,估值却已90亿就在刚刚,OpenAI前安全副总裁Lilian Weng,疑似爆出了90亿估值神秘新公司Thinking Machines的首个产品——一台专为AI训练打造的「手动调参仪表盘」?
来自主题: AI资讯
7790 点击 2025-05-26 21:05
就在刚刚,OpenAI前安全副总裁Lilian Weng,疑似爆出了90亿估值神秘新公司Thinking Machines的首个产品——一台专为AI训练打造的「手动调参仪表盘」?
Lilian Weng离职OpenAI后首篇博客发布!文章深入讨论了大模型强化学习中的奖励欺骗问题。随着语言模型在许多任务上的泛化能力不断提升,以及RLHF逐渐成为对齐训练的默认方法,奖励欺骗在语言模型的RL训练中已经成为一个关键的实践性难题。
据ZP独家报道,前OpenAI研究与安全副总裁Lilian Weng已加盟Fellows Fund,担任新的Distinguished Fellow。